查看原文
其他

学习神经科学,发展人工智能

Caesar 脑机接口社区 2022-04-26

编者的话:(这篇Science的观点文章在公众号“机器之心”上有人编译发表过,不过我没大看懂。这几天自己看了一遍,重新编译了下。)高度简化的人工神经网络,特别是深度网络模型在模仿生物感知计算方面成果突出。但在更具通用人工智能性质的认知计算方面,这个模型还能走多远?至少从系统神经科学家的角度,这是个大问题。即使只从学习这个角度考虑,神经学习本身是既有经验性又有先天性的(我前边编译的脑机接口文章里具体介绍了神经学习的模态)。脑神经系统的某些先天结构很可能是高性能学习的模型基础。而怎么找出来,目前见仁见智。

学习神经科学,发展人工智能


数学家图灵提出的“机器可以思考吗?”这个问题引发了人类对人工智能(AI)的追求。由于生物神经系统是世界上唯一已知的执行复杂计算的系统,关于脑神经环路的生理学知识就成为人工智能科学家的重要参考来源。其一条技术路线最近获得很大的成功,就是通过类似脑神经结构的电路进行智能计算,可以说是用高度的还原论方法对大脑皮层神经环路建模。这个以“深网”结构为基本形式的脑启发模型是以类神经元为元素的连续层级结构,层间由可调节的权重相连,“突触”是这种权重的仿生叫法。深网的应用对人工智能产生了变革。在包括计算机视觉,语音识别和制作以及玩复杂的游戏等人工智能研究的中心领域中,深网都优于以前所有的方法。如今已广泛应用于计算机视觉,语音和文本翻译等领域,并且在向许多其他领域大规模拓展。在这里,我将讨论对认知和通用AI网络模型具有指导价值的脑神经环路的性质。
深网中的关键问题是学习,就是通过调整突触,针对特定输入模式生成期望的输出。突触调整过程是基于一组训练示例自动执行的,示例是输入模式及其期望输出的配对。学习过程就是通过调整权重使训练输入模式的输出值与期望输出值一致。成功的学习不仅能让网络记住训练示例,而且能够泛化,对新的输入模式也能提供正确的输出,新的输入模式是指在学习过程中没出现过的。

将深网模型与生理,功能磁共振成像和行为数据进行比较后,发现大脑和这种模型有相似也有相异之处(见图)。通过与灵长类动物视觉系统做比较,可以发现生理反应和模型反应的相似性在神经反应的早期部分较高。说明深网模型较好地模拟了视觉信息的早期处理阶段,而并非较晚的视觉认知阶段。


图1:脑神经环路和学习。一个主要的开放问题是,与脑神经环路相比,现今的人工神经网络模型采用的高度简化的结构能否具有获得类人学习和认知的能力?


除了深网以外,人工智能模型最近还结合了类脑计算的另一个主要方面:强化学习(RL),即利用大脑中的奖励信号来修正行为。这种学习形式的脑机制已经获得广泛研究,其计算模型也已用于人工智能领域,特别是机器人方向。强化学习用于智能体(人,动物或机器人)做出行为并接收作为回报的奖励信号的场景中。它的目的是学习一种最佳“策略”,即从状态到行动的映射,使在一段时间内获得的报酬最大化。在最近的人工智能算法中强化学习方法已经与深网方法相结合,特别是从流行的视频游戏到高度复杂的棋类游戏(如国际象棋,围棋和将棋)中。深网与强化学习相结合在游戏中成果惊人,包括击败世界顶级围棋选手和经过约4小时训练(从游戏规则开始通过自我博弈学习)就能达到国际象棋世界冠军水平。
从用神经科学指导人工智能的角度来看,深网模型获得了令人震惊的成功,这个网络模型比脑皮层网络简化的太多了。其他一些脑启发内容,比如神经元群间标准化或空间注意已经加到深网模型中。但总体来看,几乎神经元的所有信息—结构,类型,互连性等,都没有被现在的深网模型采用。生物神经环路的哪些方面是计算的必要条件而且也对网络型人工智能系统有用?这个问题还不清楚,但两者结构上的差异很明显。例如,生物神经元在形态学,生理学和神经化学方面具有高度的复杂性和多样性。一个典型的兴奋性锥体神经元的输入广泛分布于复杂且高度分支的基底和顶端树突树上。抑制性皮层神经元具有多种不同的形态,而且执行不同的功能。这种异质性和复杂性都没有包含在典型的深网模型中,它只用了一些高度简化的同质人工神经元。在网络中各个单元间连通性方面,脑皮层环路比当前的深网模型也要复杂得多,包括同层神经元间的丰富侧向连接,也有局部和长程连接,以及从级联的高级脑区到低级脑区的自上而下的连接方式,这些都是典型的局部神经环路组织结构。
基于深网的学习方法主要是在解决基于视觉和语音等真实感知数据的问题上获得了很大的成功,最近又被用来应对更具认知性本质的问题。例如在视觉领域,最初的网络模型是来处理对象分类和分割之类的感知问题。经过扩展的类似方法现已应用于更高级别的问题,例如图像字幕(生成图像的简短文字描述)或视觉问题解答领域(回答用自然语言(即人际交流)提出的关于图像内容的问题)。其他非视觉任务包括判断幽默,发现讽刺或理解直观的物理或社会现象。类似的方法也正在发展并希望用于一些现实应用场景,例如在线翻译,灵活个人助理,医疗诊断,高级机器人或自动驾驶等技术。
针对现今如此大量的研究工作以及在未来人工智能应用上投入的巨额资金,一个主要的开放问题是,当前在用的方法将有多大的可能产生“真实的”和类人的理解力?是否有其他的,或许根本不同的方法能用来实现认知和通用人工智能(AGI)?这个问题的答案尚不得知,但无论在科学上还是商业上,现在的方法的风险都是很高的。
如果当前的深网模型在实现类人的认知能力上有限的话,那么可以寻求指导的自然之地还是神经科学。那些在人工智能模型中被忽略的大脑神经环路的特征是否就是通用人工智能的关键?大脑的哪些方面可能特别重要?答案目前尚不明朗,因为我们对脑神经环路的理解仍然有限,但我可以简要讨论下大脑和深网模型有着根本不同的方面,这可能是实现类人通用人工智能的关键点。两者的差异集中在认知上经验论和先天论的平衡问题上,即先天认知结构和通用学习机制的相对关系。当前的人工智能建模是严重依赖经验论的,使用相对简单和一致的网络结构,主要依靠大量的训练数据进行广泛的学习。相比之下,生物系统通常是在有限的训练下完成复杂的行为任务,主要依靠在学习前就已经在神经环路中编码好的特定的预存网络结构实现的快速学习。例如昆虫,鱼类和鸟类等多种动物物种可以执行复杂的导航任务,这是靠着具有复杂计算能力的一组精密的先天机制实现的。在人类中,婴儿在出生后的几个月中很少或根本没有经过明确的训练就可以发展出复杂的感知和认知技能。例如,他们可以自发地识别像人手这样的复杂物体,跟随其他人的注视方向,通过视觉区分动画角色是在利人还是损人等等,这都显示出婴儿有对物理和社会交互的初步理解力。大量的发育研究表明,人类具有快速、无监督的学习能力。人类的认知系统通过进化具备了相应的先天结构,这种结构可以帮助人类获得有意义的概念和认知技能。
与现有的深网模型相比,人类认知学习和理解的优越性可能很大程度上源于人类认知系统中包含的丰富且复杂的先天结构。婴儿期视觉学习的最新模型展示了学习与先天机制的有效结合,有意义的复杂概念既不是先天具有也不是自己学习的。先天组件不是已经发展出的概念,而是更简单的“原型概念”,它们提供内部教学信号来引导学习系统逐步获取和构建复杂概念,这基本不需要训练。例如,图像运动的特定模式能够提供用于手识别的内部教学信号。手的探测及其对物体的操纵可以引导学习系统探测注视方向,而且探测注视目标对学习推断人的意图有用。这样的先天结构可以通过特定的初始连接连到特定脑区,并向特定目标提供输入和误差信号。在人工神经网络模型中也可以采用一些预存的结构,使它们的学习和理解能力更像人类。可以通过解析和模拟相关的脑神经机制来找到有用的预存结构,也可以通过开发一些计算学习方法从“从头开始”学习并逐步发现某种特定结构,该结构能支持智能体(人或人工智能)高效灵活的学习了解环境。虽然有些尝试,但“学习先天结构”的计算问题与当前的学习过程并不相同,也还没人懂。从长远来看,将经验方法和计算方法相结合可能对神经科学和通用人工智能都有利,并且最终可能成为适用于两者的智能处理理论的组成部分。
李骁健教授  

中国科学院深圳先进技术研究院


研究方向:

面向宽带脑机接口的神经电子和神经光子技术

面向神经仿真和类脑计算的神经环路解析和解码技术

面向类人机器人的神经拟态设备和系统研发


网址:

http://people.ucas.ac.cn/~Lixiaojian


文章来源:神经工程变革技术

编译作者:李骁健老师

不用于商业行为,转载请联系后台

若有侵权,请后台留言,管理员即时删侵!

更多阅读

脑机接口技术在医疗健康领域应用白皮书

注意力缺陷障碍可以通过训练大脑来管理

脑机产业迎来“新标准”,CESI发布《脑机接口标准化白皮书》

2021世界机器人大赛脑机接口系列视频讲座之SSVEP相关

用于Brain Runners电子游戏的改进SmallNet脑电解码分类

EEGLAB 使用教程 2 - Events 和 通道位置

投稿通道

如何让你的工作让更多人知晓和受益?

脑机接口社区就是这样一个连接学界、

企业界和爱好者的平台渠道。


区鼓励高校实验室、企业或个人在我们平台上分享优质内容。


稿件要求

稿件系个人原创作品,若已在其他平台发表,请明确标注。

稿件一经录取,便提供稿费!

投稿通道

微信扫码,备注:投稿+姓名+单位

微信交流群,请扫码上方微信

(备注:姓名+单位+专业/领域行业)

QQ交流群:913607986

你的每一次在看,我都很在意!

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存